智能论文笔记

Efficient and Accurate Skeleton-Based Two-Person Interaction Recognition Using Inter- and Intra-body Graphs

Yoshiki Ito , Quan Kong , Kenichi Morita , Tomoaki Yoshinaga

分类：计算机视觉 | 机器学习

2022-07-26

随着姿势估计和图形卷积网络的进步，基于骨架的两人互动识别一直在越来越多的关注。尽管准确性逐渐提高，但计算复杂性的提高使其在现实环境中更不切实际。由于常规方法不能完全代表体内关节之间的关系，因此仍然存在准确性改善的空间。在本文中，我们提出了一个轻巧的模型，以准确识别两人的交互。除了结合了中间融合的体系结构外，我们还引入了一种分解卷积技术，以减少模型的重量参数。我们还引入了一个网络流，该网络说明体内关节之间的相对距离变化以提高准确性。使用两个大规模数据集NTU RGB+D 60和120的实验表明，与常规方法相比，我们的方法同时达到了最高准确性和相对较低的计算复杂性。

translated by 谷歌翻译

Emotion in Cognitive Architecture: Emergent Properties from Interactions with Human Emotion

Junya Morita

分类：人工智能

2022-12-28

This document presents endeavors to represent emotion in a computational cognitive architecture. The first part introduces research organizing with two axes of emotional affect: pleasantness and arousal. Following this basic of emotional components, the document discusses an aspect of emergent properties of emotion, showing interaction studies with human users. With these past author's studies, the document concludes that the advantage of the cognitive human-agent interaction approach is in representing human internal states and processes.

translated by 谷歌翻译

Estimating Personal Model Parameters from Utterances in Model-based Reminiscence

Shoki Sakai , Kazuki Itabashi , Junya Morita

分类：人工智能

2022-08-15

回忆疗法是基于记忆的回忆，是心理保健。但是，该方法的有效性在个体之间有所不同。为了解决这个问题，有必要提供更多个性化的支持；因此，本研究采用了基于思想理性（ACT-R）的认知体系结构自适应控制的个人记忆回忆的计算模型。反映用户状态的ACT-R内存模型有望促进个人回忆。在这项研究中，我们提出了一种通过与内存模型的重复相互作用来估算用户内部状态的方法。该模型包含用户的LIFELOG，向用户展示了一个内存项（刺激），并根据调整模型的内部参数的刺激接收用户对刺激的响应。通过重复这些过程，模型的参数将反映用户的内部状态。为了确认所提出方法的可行性，我们在使用合并该模型的系统时分析了用户的话语。结果证实了该方法从用户的话语中估算模型的内存检索参数的能力。此外，该方法估计使用系统引起的用户情绪变化的能力得到了证实。这些结果支持估计人类内部状态的交互式方法的可行性，这最终将有助于诱导记忆回忆和情绪为我们的幸福感。

translated by 谷歌翻译

Noise-aware Physics-informed Machine Learning for Robust PDE Discovery

Pongpisit Thanasutives , Takeshi Morita , Masayuki Numao , Ken-ichi Fukui

分类：人工智能 | 机器学习

2022-06-26

这项工作与发现物理系统的偏微分方程（PDE）有关。现有方法证明了有限观察结果的PDE识别，但未能保持令人满意的噪声性能，部分原因是由于次优估计衍生物并发现了PDE系数。我们通过引入噪音吸引物理学的机器学习（NPIML）框架来解决问题，以在任意分布后从数据中发现管理PDE。我们的建议是双重的。首先，我们提出了几个神经网络，即求解器和预选者，这些神经网络对隐藏的物理约束产生了可解释的神经表示。在经过联合训练之后，求解器网络将近似潜在的候选物，例如部分衍生物，然后将其馈送到稀疏的回归算法中，该算法最初公布了最有可能的PERSIMISIAL PDE，根据信息标准决定。其次，我们提出了基于离散的傅立叶变换（DFT）的Denoising物理信息信息网络（DPINNS），以提供一组最佳的鉴定PDE系数，以符合降低降噪变量。 Denoising Pinns的结构被划分为前沿投影网络和PINN，以前学到的求解器初始化。我们对五个规范PDE的广泛实验确认，该拟议框架为PDE发现提供了一种可靠，可解释的方法，适用于广泛的系统，可能会因噪声而复杂。

translated by 谷歌翻译

Investigation of a Data Split Strategy Involving the Time Axis in Adverse Event Prediction Using Machine Learning

Katsuhisa Morita , Tadahaya Mizuno , Hiroyuki Kusuhara

分类：机器学习

2022-04-19

不良事件是药物开发中的一个严重问题，并且已经开发了许多使用机器学习的预测方法。随机的拆分交叉验证是机器学习中模型构建和评估的事实上的标准，但是在不利事件预测中应注意，因为这种方法与现实世界的情况不符。使用时轴的时间拆分被认为适用于现实世界预测。但是，由于缺乏可比的研究，使用时间和随机分裂获得的模型性能差异尚不清楚。为了了解差异，我们使用九种类型的复合信息作为输入，八个不良事件作为目标和六种机器学习算法比较了时间和随机分裂之间的模型性能。在曲线值下，随机分裂显示的面积比八个目标中的六个时间分配比分裂更高。训练和测试数据集的化学空间相似，这表明适用性域的概念不足以解释从分裂中得出的差异。对于蛋白质相互作用，曲线差异下的面积比其他数据集更小。随后的详细分析表明，在时间分配时间内使用基于知识的信息的危险。这些发现表明，在不利事件预测中了解时间和随机分裂之间的差异的重要性，并强烈表明适当使用分裂策略和结果的解释对于不利事件的现实预测是必要的。我们提供本研究中使用的分析代码和数据集（https://github.com/mizuno-group/ae_prediction）。

translated by 谷歌翻译

Neural Network Module Decomposition and Recomposition

Hiroaki Kingetsu , Kenichi Kobayashi , Taiji Suzuki

分类：机器学习

2021-12-25

我们提出了一种模块化方法，将深神经网络（DNN）分解成小模块，从功能透视中重新编译到一些其他任务的新模型中。预计分解模块由于其体积小而具有可解释性和可验证性的优点。与基于重用模型的现有研究相比，涉及再培训的重复模型，例如传输学习模型，所提出的方法不需要再培训并且具有广泛的适用性，因为它可以容易地与现有的功能模块组合。所提出的方法利用重量掩模提取模块，可以应用于任意DNN。与现有研究不同，它不需要对网络架构的假设。要提取模块，我们设计了一种学习方法和损耗功能，可以最大化模块之间的共享权重。结果，可以重新编码提取的模块而不会大大增加。我们证明所提出的方法可以通过在模块之间共享重量来分解和重新测试具有高压缩比和高精度的DNN，并且优于现有方法。

translated by 谷歌翻译

Sequence-level self-learning with multiple hypotheses

Kenichi Kumatani , Dimitrios Dimitriadis , Yashesh Gaur , Robert Gmyr , Sefik Emre Eskimez , Jinyu Li , Michael Zeng

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-10

在这项工作中，我们开发了新的自学习技术，具有基于注意的序列 - 序列（SEQ2Seq）模型，用于自动语音识别（ASR）。对于未筛选的语音数据，ASR系统的假设必须用作标签。然而，不完美的ASR结果使得无监督的学习难以始终如一地提高识别性能，特别是在多个强大的教师模型不可用的情况下。与传统的无监督学习方法相比，我们采用\ emph {多任务学习}（MTL）框架，其中$ N $最佳ASR假设用作每个任务的标签。通过MTL框架更新SEQ2Seq网络，以查找可以涵盖多个假设的公共表示。通过这样做，可以缓解\ emph {硬决策}错误的效果。我们首先通过在美国和英国英语演讲之间通过ASR实验证明我们的自学方法的有效性。我们的实验结果表明，与仅与美国英语数据培训的基线模型相比，我们的方法可以将英国语音数据上的WER减少14.55 \％至10.36 \％。此外，我们研究了我们提出的方法在联邦学习情景中的效果。

translated by 谷歌翻译

Building a great multi-lingual teacher with sparsely-gated mixture of experts for speech recognition

Kenichi Kumatani , Robert Gmyr , Felipe Cruz Salinas , Linquan Liu , Wei Zuo , Devang Patel , Eric Sun , Yu Shi

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-10

专家（MOE）的稀疏门控混合物可以用少量计算复杂性来放大网络容量。在这项工作中，我们调查多语言自动语音识别（ASR）网络如何用简单的路由算法进行缩放，以便实现更好的准确性。更具体地，我们将稀疏门的MOE技术应用于两种网络：序列到序列变压器（S2S-T）和变压器换能器（T-T）。我们通过一组关于多语言数据的一组ASR实验证明了MOE网络可以分别使用S2S-T和T-T将相对字误差率降低16.5 \％和4.7 \％。此外，我们在各种条件下彻底调查了MOE对T-T架构上的T-T架构的影响：流模式，非流模式，使用语言ID和带有MOE的标签解码器。

translated by 谷歌翻译

Achieving Explainability for Plant Disease Classification with Disentangled Variational Autoencoders

Harshana Habaragamuwa , Yu Oishi , Kenichi Tanaka

分类：计算机视觉 | 人工智能

2021-02-05

Agricultural image recognition tasks are becoming increasingly dependent on deep learning (DL); however, despite the excellent performance of DL, it is difficult to comprehend the type of logic or features of the input image it uses during decision making. Knowing the logic or features is highly crucial for result verification, algorithm improvement, training data improvement, and knowledge extraction. However, the explanations from the current heatmap-based algorithms are insufficient for the abovementioned requirements. To address this, this paper details the development of a classification and explanation method based on a variational autoencoder (VAE) architecture, which can visualize the variations of the most important features by visualizing the generated images that correspond to the variations of those features. Using the PlantVillage dataset, an acceptable level of explainability was achieved without sacrificing the classification accuracy. The proposed method can also be extended to other crops as well as other image classification tasks. Further, application systems using this method for disease identification tasks, such as the identification of potato blackleg disease, potato virus Y, and other image classification tasks, are currently being developed.

translated by 谷歌翻译